花费 15 ms
炼丹宝典 | 整理 Deep Learning 调参 tricks

记录炼丹优化tricks 最后更新: 2020-04-15 18:17:57 寻找合适的学习率(learning rate) 学习率是一个非常非常重要的超参数,这个 ...

Fri Apr 10 00:50:00 CST 2020 0 5445
论文阅读 | Adversarial Training for Large Neural Language Models

本文把对抗训练用到了预训练和微调两个阶段,对抗训练的方法是针对embedding space,通过最大化对抗损失、最小化模型损失的方式进行对抗,在下游任务上取得了一致的效果提升。有趣的是, ...

Thu Oct 15 01:01:00 CST 2020 2 780

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM